Материалы по тегу: big data

01.10.2024 [21:45], Владимир Мироненко

«Группа Аренадата» привлекла 2,7 млрд рублей в ходе IPO

ПАО «Группа Аренадата» (Группа Arenadata), российский разработчик ПО для систем управления и обработки данных, объявило об успешном проведении первичного публичного предложения (IPO), прошедшего по верхней границе ценового диапазона. Сообщается, что «Группа Аренадата» стала первой публичной компанией среди разработчиков системного ПО для работы с данными. Стоимость акции составила 95 руб., а оценка рыночной капитализации компании достигла 19 млрд руб.

В ходе IPO со стороны текущих акционеров было предложено 28 млн акций на сумму около 2,7 млрд руб. по цене IPO, включая 2,8 млн акций, которые могут быть использованы для стабилизации цены акций на вторичных торгах в период до 30 дней после начала торгов.

В результате IPO акционерами группы стали около 30 тыс. частных инвесторов. Акции были распределены между категориями инвесторов в следующей пропорции: 57 % получили институциональные инвесторы, 27 % — розничные инвесторы и 16 % — партнёры продающих акционеров. Аллокация (распределение акций) розничным инвесторам составила около 5 %. Каждый розничный инвестор получил не менее 1 акции, те, кто подал более 10 заявок, не получили аллокации.

 Источник изображения: «Группа Аренадата»

Источник изображения: «Группа Аренадата»

Как отметил в интервью «Агентству Бизнес Новостей» представитель ПАО «Группа Аренадата», на размер аллокации повлиял «размер сделки, повышенный интерес как со стороны институциональных инвесторов — крупнейших УК, инвестиционных фондов, так и со стороны частных инвесторов». По данным «Агентства Бизнес Новостей», в ходе IPO Iva Technologies аллокация среди розничных инвесторов составила 5–10 %, столько же у IT-компании Positive Technologies и 4 % — у «Группы Астра».

После выхода на биржу доля акций в свободном обращении (free-float) составит порядка 14 % от акционерного капитал группы. Акции под тикером DATA и ISIN RU000A108ZR8 были включены во второй уровень листинга Московской биржи. Первые торги акциями «Группы Аренадата» прошли сегодня, 1 октября 2024 года.

Компания была основана в 2015 году как дочерняя структура IBS, но впоследствии отделилась от родительской компании. В 2017 года компания представила свой первый продукт — Arenadata Hadoop. В дальнейшем на рынок были выведены Arenadata DB, Arenadata QuickMarts, Arenadata Cluster Manager, Arenadata Streaming, Arenadata Postgres и т.д. По состоянию на 2023 году объём данных на платформе Arenadata превысил 60 Пбайт.

Постоянный URL: http://servernews.ru/1111834
24.09.2024 [14:45], Андрей Крупин

VK создала собственную платформу для работы с большими объёмами данных и машинным обучением

Занимающаяся разработкой корпоративного ПО компания VK Tech (входит в экосистему VK) сообщила о запуске Data Platform — платформы для комплексной работы с большими объёмами данных, нейросетями и искусственным интеллектом. В течение трёх лет в VK намерены инвестировать в новое решение и связанные с ним сервисы до 4 млрд руб.

VK Data Platform относится к категории универсальных инструментов Enterprise Data Platform (EDP) и позволяет решать широкий спектр задач: от хранения и обработки данных до выполнения аналитических процессов и разработки моделей машинного обучения. В основу платформы положены собственные разработки компании, в частности, Tarantool и S3-совместимое хранилище Cloud Storage, и доработанные VK технологии, среди которых Trino, PostgreSQL, Airflow и многие другие.

 Функциональная архитектура VK Data Platform

Функциональная архитектура VK Data Platform

Компоненты VK Data Platform разворачиваются на основе Kubernetes. Это позволяет динамически распределять вычислительные мощности, эффективно утилизировать аппаратное обеспечение и предоставлять высокий уровень отказоустойчивости. Пользователям доступны централизованные инструменты мониторинга, создания резервных копий данных и графический интерфейс для управления платформой.

Платформа может быть развёрнута на различных типах инфраструктуры, включая публичные и частные облака, а также собственные серверы заказчика. В ней предусмотрены типовые архитектуры на основе Data WareHouse, Data Lake, LakeHouse и Data Mesh, MLOps-конвейеров, а также конфигурации для систем с высокой транзакционной нагрузкой. По заверениям разработчика, это позволяет быстро адаптировать её под задачи любой компании и ускоряет интеграцию решения в корпоративный IT-ландшафт.

Постоянный URL: http://servernews.ru/1111446
10.06.2024 [22:02], Владимир Мироненко

Не хочешь конкурировать — купи: Databricks приобрела Tabular за $1+ млрд, чтобы унифицировать озёра данных

Американский стартап в сфере аналитики больших данных и машинного обучения Databricks объявил о приобретении компании по управлению данными Tabular. Точная сумма сделки не раскрывается, но глава Databricks Али Годси (Ali Ghodsi) сообщил в интервью CNBC, что стоимость покупки превышает $1 млрд. Соучредители Tabular присоединятся к Databricks, где будут работать над объединением клиентских баз и сообществ Tabular и Databricks.

Компания Tabular была основана ими в 2021 году. Она предлагает продукты для управления данными, созданные на основе Apache Iceberg — проекта, которым создатели Tabular занимались в Netflix и позже передали в дар фонду Apache Software Foundation. Iceberg — открытый формат для таблиц сверхбольших данных. Databricks предлагает объектно-ориентированное озеро данных Lakehouse на базе собственного открытого формата Delta Lake.

 Источник изображения: Tabular

Источник изображения: Tabular

С момента создания Delta Lake в проекте приняли участие более 500 разработчиков. Более 10 тысю компаний по всему миру используют Delta Lake для обработки в среднем более 4 Эбайт данных каждый день. Это быстрорастущий бизнес, но Iceberg-решения не менее популярны и конкурируют с решениями Databricks, отметил ресурс Blocks & Files. При этом о полной совместимости между Iceberg и Delta Lake речи не было.

Но в 2023 году компания также представила UniForm-таблицы, позволяющие работать с Delta Lake, Iceberg и Hudi. А после поглощения Databricks будет тесно сотрудничать с сообществами Delta Lake и Iceberg для разработки совместимых форматов озёр данных. В краткосрочной перспективе это будет реализовано в рамках Delta Lake UniForm, а в долгосрочной перспективе будет создан единый, открытый и общий стандарт.

Постоянный URL: http://servernews.ru/1106232
09.10.2023 [12:41], Сергей Карасёв

К 2030 году в России может появиться единое доверенное хранилище данных

АНО «Цифровая экономика», по сообщению газеты «Ведомости», предлагает сформировать в России единое доверенное хранилище данных. Предполагается, что такая платформа будет развёрнута к 2030 году, что поможет в развитии государственных сервисов и бизнес-систем.

С инициативой выступает группа экспертов, возглавляемая вице-президентом «Ростелекома» Борисом Глазковым. Говорится, что к концу текущего десятилетия «90 % обработанных данных в обезличенном или персонифицированном виде доступны государству, бизнесу и гражданам в едином доверенном источнике для развития data driven госуправления и бизнеса в РФ».

 Источник изображения: pixabay.com

Источник изображения: pixabay.com

Под термином «data driven госуправление» подразумевается разработки и реализации государственной политики, в которой принятие решений и формулирование политических стратегий основаны на обширном сборе, анализе и использовании всевозможных данных. Получаемая из различных источников информация может быть использована для оценки текущей ситуации, выявления проблем и проработки потенциальных решений, а также для анализа воздействия политики на общество.

3 сентября 2023 года президент России Владимир Путин поручил утвердить национальный проект по формированию экономики данных на период до 2030-го. Инициатива предусматривает сбор информации, в том числе с использованием высокочувствительных датчиков на основе квантовых сенсоров. Кроме того, должна быть создана инфраструктура вычислений и хранения данных с использованием отечественных оборудования, технологий и программного обеспечения, в том числе облачных платформ, ЦОД и вычислительных мощностей.

Участники рынка говорят, что сбор и обработка огромного объёма данных технически возможны с использованием современных технологий, но требуют мощных вычислительных ресурсов. Для формирования единого хранилища потребуется принятие новых законодательных норм, гарантирующих «безопасность данных и защиту личной конфиденциальности». В целом, проект может помочь в создании отечественного ПО, поскольку разработчикам часто не хватает данных для проверки гипотез и написания более эффективных приложений.

Постоянный URL: http://servernews.ru/1094179
19.09.2023 [00:13], Владимир Мироненко

NeuroBlade интегрирует SQL-ускорители SPU с Velox

Стартап NeuroBlade, специализирующийся на разработке решений для ускорения анализа данных, объявил о сотрудничестве с сообществом Velox компании Meta Platforms с целью интеграции ускорителя SQL Processing Unit (SPU) в новый унифицированный фреймворк для работы с данными.

Как отметили в NeuroBlade, полная интеграция SPU NeuroBlade в Velox обеспечивает ускорение обработки данных более чем в 10 раз, помимо трёхкратного повышения производительности, уже достигнутого Velox за счет оптимизации ПО. Цель проекта заключается в том, чтобы дать компаниям возможность эффективно обрабатывать огромные наборы данных, говорится в пресс-релизе.

 Источник изображения: NeuroBlade

Источник изображения: NeuroBlade

Элад Сити (Elad Sity), гендиректор и соучредитель NeuroBlade, подчеркнул важность совместных усилий, которые «знаменуют эпоху, когда организации смогут умело управлять растущими объёмами данных, повышать производительность аналитики и получать значительные конкурентные преимущества».

Velox представляет собой унифицированный open source движок, который объединяет различные программные оптимизации в области обработки запросов в единую высокопроизводительную библиотеку, а в будущем и в самостоятельный фреймворк. Velox уже совместим с Presto и Apache Spark. Интеграция SPU NeuroBlade в Velox достигается за счёт новых API Velox, которые позволят произвольно переносить выполнение части запросов на ускоритель.

Как отмечается в пресс-релизе, CPU с трудом справляются с аналитическими запросами, скорость которых превышает 2–3 Гбайт/с, из-за ограничений в обработке данных и сложности запросов. SPU NeuroBlade позволяет решить эту проблему, поскольку предлагает специализированный процессор, который обеспечивает аппаратную обработку сложных запросов и работу с памятью и хранилищем, что позволяет разгрузить CPU и добиться постоянной пропускной способности при обработке больших данных и снизить задержки.

Постоянный URL: http://servernews.ru/1093204
16.09.2023 [21:34], Сергей Карасёв

Стартап Databricks привлёк ещё $500 млн, что повысило капитализацию компании до $43 млрд

Стартап Databricks, разработчик платформы машинного обучения, анализа и обработки данных, сообщил о проведении раунда финансирования Series I: на развитие привлечено дополнительно $500 млн. Таким образом, на сегодняшний день общий объём инвестиций в эту компанию превысил $4 млрд.

Databricks предоставляет озеро данных, которое предприятия могут использовать для хранения, организации и анализа больших объемов информации. Стартап также помогает заказчикам в развёртывании собственных приложений на базе генеративного ИИ. Компания основана в 2013 году создателями Apache Spark.

 Источник изображения: Gabby Jones / Bloomberg

Источник изображения: Gabby Jones / Bloomberg

Отмечается, что Databricks быстро наращивает выручку: по итогам II четверти текущего финансового года, которая была закрыта 31 июля, показатель преодолел знаковый рубеж в $1,5 млрд — это более чем на 50 % превосходит прошлогодний результат. В глобальном масштабе решения Databricks применяют свыше 10 тыс. организаций, включая более половину компаний из списка Fortune 500.

Раунд финансирования Series I проведён под руководством T. Rowe Price Associates. В программе также приняли участие Andreessen Horowitz, Baillie Gifford, ClearBridge Investments, Counterpoint Global (Morgan Stanley), Fidelity Management & Research Company, Franklin Templeton, GIC, Octahedron Capital, Tiger Global, Capital One Ventures, Ontario Teachers' Pension Plan и NVIDIA.

Прошлый раунд финансирования Databricks был завершён в 2021 году: тогда стартап получил $1,6 млрд, а его рыночная стоимость достигла $38 млрд. Теперь же капитализация оценивается в $43 млрд при стоимости акций на уровне $73,5.

Постоянный URL: http://servernews.ru/1093138
14.07.2023 [18:44], Руслан Авдеев

Минцифры России подготовит национальный проект «Экономика данных»

Минцифры сообщило о скором начале реализации очередного национального проекта «Экономика данных». Как сообщает пресс-служба министерства, проект подготовят до конца текущего года. При этом реализация нового проекта будет продолжаться до 2030 года. Целью проекта станет перевод всей экономики, социальной сферы и органов власти на новый уровень. Это касается решений в области логистики, телемедицины, онлайн-образования и предоставления госуслуг.

Как сообщает «Интерфакс», речь идёт не только о консолидации уже существующих инструментов, применяемых для развития систем ИИ, квантовых технологий и цифровой экономики в целом — необходимо выстроить целостный механизм создания и внедрения новых разработок. Как уточняется, фокус следует сделать на ряде направлений:

  • Сбор данных с использованием высокочувствительных датчиков, включая квантовые сенсоры. Такие технологии уже применяются как в промышленности, так и, например, в медицине и системах связи;
  • Передача данных и развитие систем связи. Связь должна обеспечиваться в режиме реального времени на больших скоростях — это и отсутствие задержек при передаче информации необходимо для автоматизации транспорта и городской среды вообще;
  • Хранение данных в стране должно быть эффективно организовано за счёт развития облачных платформ, ЦОД и собственных вычислительных мощностей, включая квантовые компьютеры;
  • Безопасность данных должна быть обеспечена благодаря квантовым технологиям передачи данных и шифрования, способным противостоять любым угрозам, в том числе атакам с использованием квантовых компьютеров;
  • Стандарты и протоколы работы с данными необходимы во всех IT-сферах, как для обеспечения безопасности, так и для того, чтобы регламентировать хранение персональных данных, в том числе с использованием квантовой криптографии;
  • Наконец, внимание будет уделяться обработке и анализу данных и созданию репозиториев открытого кода, причём анализ данных необходимо проводить на основе ИИ-алгоритмов, используя отечественное программное обеспечение. Для этого потребуется развитие отечественных сервисов и платформ для совместной работы программистов со всего мира, в первую очередь из России.
 Источник изображения: ThisisEngineering RAEng/unsplash.com

Источник изображения: ThisisEngineering RAEng/unsplash.com

Как сообщают в Минцифры, новый национальный проект в конечном счёте направлен на повышение качества жизни граждан за счёт роста качества работы властей, роста экономики и развития социальной сферы. Какие средства будут выделены на реализацию проекта и какие именно направления будут развиваться особенно активно, будет объявлено позже.

Постоянный URL: http://servernews.ru/1089996
19.04.2023 [15:35], Татьяна Золотова

АБД: рынок Big Data в России вырастет до 319 млрд руб. к концу 2024 года, но его развитие будет зависеть от действий государства

Рынок больших данных в России при базовом сценарии развития вырастет до 319 млрд руб. к концу 2024 года, полагают в Ассоциации участников рынка больших данных (АБД, объединяет «Яндекс», VK, «Ростелеком», «Мегафон» и др.). АБД разработала стратегию развития ИТ-рынка, описывающую пять различных сценариев. Об этом сообщает «Коммерсантъ».

Наилучший сценарий (рост рынка до 441 млрд руб.) предполагает появление страхования от утечек персональных данных для защиты их субъектов. Целевой подразумевает рост рынка со 170 млрд руб. в 2021 году до 319 млрд руб. в 2024 году. В этом случае рынок должен быть «приоритетным для государства», а услуги и решения в области Big Data — распространяться на другие сегменты, где нужно стимулировать спрос и заниматься импортозамещением ПО.

 Изображение: Wynn Pointaux / Pixabay

Изображение: Wynn Pointaux / Pixabay

Если же, пишет «Коммерсантъ», государство будет вести политику «мобилизационной экономики» в области Big Data (монополизация и возложение госзаданий на крупные компании), то граждане будут готовы делиться минимумом информации. При таком сценарии рынок больших данных в России составит всего 189 млрд руб. к концу 2024 года.

Стратегия обсуждается с администрацией президента, Минцифры, Минэкономики, Минпромторгом, Госдумой и Советом федерации. В Минцифры «Коммерсанту» сообщили, что представили АБД договорились с бизнесом о разработке совместного проекта по подготовке ИТ-аналитики, чтобы заполнить нишу отраслевой аналитики, которая образовалась после ухода с рынка ряда западных агентств.

Постоянный URL: http://servernews.ru/1085246
03.04.2023 [21:51], Татьяна Золотова

За кредитование Сбера ответит собственная графовая платформа

Сбер разработал графовую платформу для работы с большими данными и встроил ее в бизнес-процессы корпоративного и розничного кредитования. В компании уверяют, что это позволит эффективнее принимать решения о выдаче кредитов и их параметрах.

Платформа состоит из восьми сервисов. «Лаборатория графов» — это интерактивный инструмент для исследования графов и разработки новых графовых моделей (ML), который позволяет пользователям загружать свои данные и строить собственные витрины. Сервис «Графовые расчеты» помогает выполнять массовые регулярные расчеты на больших графах для исполнения графовых моделей. «Единый граф клиентских связей» (ЕГКС) объединяет актуальные витрины данных о полной связанности между собой всех клиентов банка.

 Источник изображения: Kevin Ku/unsplash.com

Источник изображения: Kevin Ku/unsplash.com

Еще один сервис — «Онлайн-доступ к графу» — работает в режиме «вопрос – ответ». Например, он поможет выяснить, есть ли признаки фрода (мошеннических операций) в окружении клиента. «Визуализация графов» отвечает за доступ к интерактивному просмотру графов и выявляет скрытые взаимосвязи между компаниями и физлицами, а сервис поиск неявных связей Link Prediction — за неизвестные факты о связанности клиентов, если данные о них изначально отсутствовали или были скрыты.

Среди сервисов также есть «Графовые нейронные сети» (GNN) — это готовый пайплайн обучения Graph Convolutional Network на базе PyTorch Geometric по собственным таргетам. «Встраиваемая графовая база данных» подходит для нестандартных решений. В ядре платформы Сбера находится собственная производительная база данных FastGraph, а также open-source-технологии стека Hadoop.

Как отмечают в компании, уже собрано более 17 Пбайт плотно связанной между собой неоднородной обезличенной информации. Сервисы платформы применяются в десятках автоматизированных бизнес-процессов Сбера. BI-инструментами и данными платформы пользуется 6,5 тыс. специалистов компании.

Постоянный URL: http://servernews.ru/1084444
24.03.2023 [23:08], Андрей Крупин

R-Style Softlab представила импортозамещённую платформу для работы с данными

Входящая в группу «Россельхозбанка» компания R-Style Softlab сообщила о выпуске на российский рынок нового продукта R-Style Intelligent System (RSIS), предназначенного для работы с данными и организации долгосрочного их хранения средствами СУБД ArenaDataDB, GreenPlum, PostgreSQL.

RSIS позволяет собирать и аккумулировать данные из различных источников, обрабатывать их и визуализировать полученные результаты, что способствует принятию эффективных управленческих решений. В основу платформы положена датацентричная реализация с применением методологии Data Vault («Свод данных»). По заверениям разработчика, такой подход обеспечивает высокую скорость загрузки и обработки данных.

 Источник изображения: our-team / freepik.com

Источник изображения: our-team / freepik.com

В числе прочих особенностей R-Style Intelligent System называются совместимость программного комплекса с отечественными решениями класса Business Intelligence (BI), поддержка потоковой и пакетной загрузки данных, в том числе механизмов взаимодействия с пакетом Apache Hadoop, возможность интеграции с партнёрскими решениями на базе искусственного интеллекта. Для обеспечения актуальности и качества данных возможно применение методологии Data Governance.

«Мы придерживаемся комплексного подхода к автоматизации работы с данными. Наш продукт совместим с отечественными BI-инструментами. Благодаря применению готовых решений партнёров, система может дополняться функциями для управления потоками данных, обеспечения мобильности, построения моделей данных, применения AI-технологий и т. д. По требованию заказчика мы можем также предоставить оборудование и системное ПО», — отмечает компания-разработчик платформы RSIS.

Постоянный URL: http://servernews.ru/1084004

Входит в перечень общественных объединений и религиозных организаций, в отношении которых судом принято вступившее в законную силу решение о ликвидации или запрете деятельности по основаниям, предусмотренным Федеральным законом от 25.07.2002 № 114-ФЗ «О противодействии экстремистской деятельности»;

Система Orphus